Text copied to clipboard!

Наслов

Text copied to clipboard!

Inženjer za pouzdanost sajta

Опис

Text copied to clipboard!
Tražimo Inženjera za pouzdanost sajta koji će se pridružiti našem tehničkom timu i igrati ključnu ulogu u obezbeđivanju visoke dostupnosti, performansi i skalabilnosti naših digitalnih servisa. Kao Inženjer za pouzdanost sajta (SRE), bićete odgovorni za dizajniranje, implementaciju i održavanje sistema koji omogućavaju neprekidan rad naših aplikacija i infrastrukture. Vaš zadatak će biti da balansirate između razvoja softvera i operacija, koristeći inženjerski pristup za rešavanje problema u produkcionom okruženju. Radom u bliskoj saradnji sa timovima za razvoj, DevOps i bezbednost, doprinosićete unapređenju automatizacije, monitoringa i procesa oporavka od grešaka. Idealni kandidat ima snažno tehničko znanje, iskustvo u radu sa distribuiranim sistemima, kao i sposobnost da brzo reaguje na incidente i identifikuje korenske uzroke problema. Takođe, očekuje se da doprinosite kulturi pouzdanosti kroz dokumentaciju, edukaciju i unapređenje procesa. Odgovornosti uključuju razvoj alata za automatizaciju, postavljanje i održavanje sistema za nadzor i upozoravanje, kao i učestvovanje u planiranju kapaciteta i testiranju otpornosti sistema. Bićete uključeni u rotaciju za hitne intervencije (on-call), kao i u retrospektive nakon incidenata kako bi se sprečilo njihovo ponavljanje. Ako ste strastveni u vezi sa stabilnošću sistema, volite da rešavate kompleksne tehničke izazove i želite da radite u dinamičnom okruženju, pozivamo vas da se prijavite i postanete deo našeg tima.

Одговорности

Text copied to clipboard!
  • Održavanje visoke dostupnosti i performansi sistema
  • Razvoj i implementacija alata za automatizaciju
  • Postavljanje i održavanje sistema za monitoring i upozoravanje
  • Analiza i rešavanje incidenata u produkcionom okruženju
  • Saradnja sa timovima za razvoj i operacije
  • Učestvovanje u planiranju kapaciteta i skalabilnosti
  • Pisanje i održavanje tehničke dokumentacije
  • Učestvovanje u rotaciji za hitne intervencije (on-call)
  • Testiranje otpornosti sistema i planiranje oporavka
  • Unapređenje procesa kroz retrospektive i analize

Захтеви

Text copied to clipboard!
  • Diploma iz oblasti informatike, elektrotehnike ili srodne oblasti
  • Iskustvo u radu sa Linux/Unix sistemima
  • Poznavanje skript jezika (npr. Python, Bash)
  • Iskustvo sa alatima za monitoring (npr. Prometheus, Grafana)
  • Razumevanje mrežnih protokola i sigurnosnih praksi
  • Iskustvo sa cloud platformama (AWS, GCP, Azure)
  • Poznavanje CI/CD alata i procesa
  • Sposobnost rešavanja problema pod pritiskom
  • Odlične komunikacione i timske veštine
  • Iskustvo sa kontejnerizacijom (Docker, Kubernetes) je prednost

Могућа питања на интервјуу

Text copied to clipboard!
  • Koje alate za monitoring ste koristili i kako ste ih konfigurisali?
  • Kako pristupate rešavanju incidenata u produkcionom okruženju?
  • Imate li iskustva sa automatizacijom operativnih zadataka?
  • Kako biste testirali otpornost sistema na greške?
  • Koje cloud platforme ste koristili i u kom kontekstu?
  • Kako balansirate između brzine isporuke i stabilnosti sistema?
  • Da li ste učestvovali u post-mortem analizama incidenata?
  • Kako biste unapredili postojeći sistem za upozoravanje?
  • Koje metrike smatrate ključnim za praćenje pouzdanosti sistema?
  • Kako sarađujete sa timovima za razvoj i DevOps?